derStandard.at > 2016 > Jahresrückblick

Die Unternehmen-Website und Wikipedia bieten weitere Informationen zum Unternehmen.

Der Standard ist eine österreichische Tageszeitung die von der STANDARD Verlagsgesellschaft m.b.H. verlegt wird. Die Zeitung betreibt ihr eigenes Web Portal derStandard.at, welches eines der größten Web Portale in Österreich ist. Es bietet freien Zugriff auf tagesaktuelle Nachrichten, Liveberichte, Interviews und mehr. Die großen Themengebiete umfassen Politik, Wirtschaft, Sport, Web, Kultur und Wissenschaft. Auch erlaubt das Portal den Lesern das Kommentieren der Artikel – was zur Bildung einer lebhaften Community geführt hat.

Manuel J. A. Eugster http://mjae.net

Seit Jahren bin ich ein täglicher Leser des Der Standard Webportals. Ich bin auch ein Data Scientist. Dieser Artikel ist die Zusammenführung dieser beiden Interessen.

Datengrundlage

derStandard.at stellt ein Archiv aller veröffentlichten Artikel zur Verfügung. Für diese Analyse wurden alle Artikel, welche in den Wochen 2015-W53 bis 2016-W52 veröffentlicht wurden, einbezogen. Ausgeschlossen wurden Artikel veröffentlicht auf dieStandard.at und daStandard.at sowie Userbeiträge und Livebeiträge.

Aus einem veröffentlichten Artikel wurden folgende Elemente für die Analyse extrahiert: Themenseite mit Haupt-Themengebiet, Titel, Autor, Datum, Zusammenfassung, Text und Anzahl der Kommentare.

Nackte Zahlen

Im Jahr 2016 wurden 68699 Artikel auf derStandard.at online gestellt und 6336232 Kommentare gepostet. Die beiden Zeitreihen im wöchentlichen Verlauf schauen wie folgt aus:

Mittels eines Kerndichteschätzer (blaue Linie) erhält man ein geglättetes Bild über die wöchtenlichen Häufigkeiten.

Im Durchschnitt wurden 1296 Artikel pro Woche veröffentlicht und 119551 Kommentare gepostet. Die Visualisierung zeigt einige Schwankungen zwischen den einzelnen Wochen. Ferienzeiten etwa, wie die Sommerzeit von 2016-W28 bis 2016-W34, sind bei den Artikeln klar zu erkennen. Auch bei den Kommentaren ist die Sommerzeit zu erkennen. Interessanterweise steigt die Anzahl der Kommentare nach der Sommerzeit nicht mehr auf das ursprüngliche Niveau zurück.

Themenbaum

Der Artikel “Die Niederländer sind keine Malteser”, zum Beispiel, ist auf der Themenseite Sport > Fußball > Nationalteam.

derStandard.at unterteilt Artikel in Themengebiete bzw. Themenseiten. Jeder Artikel ist eindeutig einer Themenseite zugeteilt. Diese Abhängigkeit lässt sich in einer (zirkulären) Baumdarstellung visualisieren. Die Knoten stellen die Themenseiten dar und die Kanten deren Abhängigkeiten. Die Farben der Kanten und Knoten entsprechen den einzelnen Haupt-Themengebieten; Tooltips bei den einzelnen Knoten zeigen Informationen zu den Knoten (welche Themenseite dieser Knoten darstellt, Anzahl an Artikel und Anzahl der Unter-Themenseiten).

Kommentare

derStandard.at erlaubt es Lesern, Artikel zu kommentieren. Das ermöglicht es, eine Schätzung des Leserinteresses zu bestimmen: Welches Themengebiet bzw. welche Themenseite und welcher Artikel haben die meisten Kommentare im Jahr 2016 bekommen?

Die Top-5 Haupt-Themengebiete in Bezug auf Leserkommentare waren Inland (38 mal mit dem Artikel welcher die meisten Kommentaren in einer Woche hat), Panorama (30), International (12), Wirtschaft (11) und Sport (4). Der Artikel mit den meisten Kommentaren war Geiselnahme in Kirche in Nordfrankreich: Ein Attentäter trug Fußfessel, knapp gefolgt von Van der Bellen: “Dann fließt eben Blut – metaphorisch gesprochen” und Immer mehr Anzeigen wegen Übergriffen in Köln – Zahl der Täter unbekannt.

Stimmungsbilanz

Sentimentanalye untersucht Texte auf ihre positive oder negative Haltung. Hier wird dazu das NRC Word-Emotion Association Lexicon Wörterbuch verwendet.

Die Trend-Visualisierungen zeigen, dass 2016 ein spannendes Jahr mit vielen Ereignissen war. Es stellt sich die Frage, ob die Stimmung im Jahr 2016 positiv oder negativ war (natürlich “durch die Brille” von derStandard.at). Durch die Aggregation der Stimmungsladungen einzelner Wörter kann eine Stimmungsbilanz für 2016 berechnet werden.

Die Visualisierung zeigt, dass die Stimmung im Jahr 2016 insgesamt gesehen eher positiv als negativ war: 56.75% positiv zu 43.25% negativ. Die Stimmung lässt sich auch in acht Basisemotionen aufteilen:

Die Farbe und Helligkeit der Balken deutet die generelle Grundstimmung der Emotion an. Die Top-3 Basisemotionen im Jahr 2016, transportiert durch die Zeitungsartikel im derStandard.at, waren Vertrauen (21.61%; stark positiv geladen), Erwartung (15.45%; leicht positiv geladen) und Angst (15.12%; stark negativ geladen).

Stimmungsbarometer “Bundespräsidentenwahl”

Ein großes Ereignis im Jahr 2016 war die Bundespräsidentenwahl. derStandard.at berichtet auf einer eigenen Themenseite über die Ereignisse um den Bundespräsidenten. Auf dieser Themenseite wurden 729 Artikel veröffentlicht. Nachfolgende Visualisierung zeigt die Stimmung im Zeitverlauf (ein Wert größer 0 deutet eine positive Stimmung an, ein Wert kleiner 0 eine negative; die drei vertikalen Linien zeigen den 1. Wahlgang, Stichwahl und die Wahlwiederholung an):

Die Stimmung startete positiv, wurde kurz vor dem 1. Wahlgang negativ und fing dann wieder an vor der Wahlwiederholung ins Positive zu steigen. Die negativste Woche war 2016-W30, die Top-2 negativsten Artikel in dieser Woche waren Höchstrichter Schnizer lässt FPÖ abblitzen und Tiroler nach Hofer-Klage wegen übler Nachrede verurteilt. Die positivste Woche war 2016-W49 direkt nach der Wahlwiederholung; die Top-2 positivsten Artikel in dieser Woche waren Kurz erwartet “ausgezeichnete Zusammenarbeit” mit Van der Bellen und Van der Bellens erste Rede: Vorsichtiger als sein Vorgänger.

Schluss

derStandard.at bietet nicht nur eine große Menge an tagesaktuellen Nachrichten, sondern auch eine perfekte Spielwiese für Data Science. Die hier präsentierten Analysen und Visualisierungen sind nur ein kleiner Teil des Möglichen. Ein weiteres sehr spannendes Thema wäre zum Beispiel die detaillierte Analyse der Leserkommentare um die Stimmung der Leser bezüglich eines Themas zu ermitteln – das muss aber bis zum Jahresrückblick 2017 warten!

Technische Details: Diese Auswertung wurde mit R und den Paketen Rmarkdown, tufte, ggplot2, plotly, visNetwork, httr und xml2 erstellt.